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基于 深度 学 习 的 判决 结果 倾向 性 分 析 


王 业 沛 !， 宋 梦 嫌 :， 王 吝 ;， 赵 志 宏 
(南京 大 学 软件 学 院 ， 南 京 210093) 


摘 要 : 裁判 文书 中 判决 结果 的 倾向 性 分 析 是 指 判 断 裁判 文书 中 的 判决 结果 是 否 支持 原告 的 诉讼 请 求 。 判 决 结果 的 倾 
向 性 分 析 对 于 裁判 文书 的 规范 化 、 推 荐 诉讼 律师 等 后 续 工 作 有 重大 的 意义 ， 但 是 缺少 有 效 的 分 析 模 型 。 为 了 充分 利用 
海量 数据 的 裁判 文书 ， 提 出 了 一 个 判决 结果 倾向 性 分 析 的 模型 。 从 半 结 构 化 的 裁判 文书 中 抽取 出 关键 特征 ， 利 用 模糊 
匹配 的 方式 对 判决 结果 中 的 多 重 实体 进行 识别 和 清洗 , 将 处 理 结果 交 由 基于 LSTM 的 深度 学 习 神 经 网 络 进行 倾 向 性 判 
断 。 通 过 对 三 种 案由 的 数据 集 进行 实验 ， 该 模型 的 准确 率 最 高 可 达 98.3%， 验 证 了 该 模型 在 判决 结果 的 倾向 性 分 析 任 
务 中 具有 很 高 的 有 效 性 。 
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Orientation analysis of judgment results based on deep learning 


Wang Yepei!, Song Mengjiao’, Wang Xuan3, Zhao Zhihong’ 
(Sofitware Engineering, NanJing University, NanJing 210093, China) 


Abstract: The orientation analysis of judgment results in the judgment documents is analyzing whether the results support the 
plaintiffs’ claims. The orientation analysis of judgment results is of great significance to the standardization of the judgment 
documents and the recommendation of litigation lawyers. However, there is no effective analysis model. In order to make full 
use of the massive data of the judgment documents, this paper designs a model for orientation analysis: we extracted the key 
features from the semi-structured judgment documents, and identified and cleaned the multi-entities in the judgment results by 
fuzzy matching. The results are processed by deep learning neural network based on LSTM for analyzing orientation. By 


experimenting with the data set of three different kinds of cases, the accuracy of the model is up to 98.3%, which verifies the 


validity ofthe model in the orientation analysis task of the judgment results. 
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两 个 任务 的 研究 对 象 都 属于 短文 本 范畴 ， 字 数 通 常 不 超过 200 
个 字符 。 其 次 ， 情 感 分 析 主 要 涉及 情感 信息 单元 抽取 和 情感 信 
裁判 文书 是 法 院 代表 国家 行使 审判 权 对 具体 案件 的 实体 或 息 的 倾向 性 分 析 ， 而 判决 结果 倾向 性 分 析 涉 及 判决 信息 单元 的 
程序 问题 作出 具有 法 律 效力 的 权威 性 书面 结论 。 裁 判 文 书 通过 ”抽取 及 其 倾向 性 分 析 。 因 此 ， 可 以 采用 类 似 短文 本 情感 分 析 的 
书面 的 形式 记录 裁判 过 程 和 裁判 依据 、 裁判 理由 和 裁判 结果 中。 ”方法 来 解决 判决 结果 的 倾向 性 分 析 问 题 。 
裁判 文书 中 判决 结果 的 倾向 性 分 析 是 指 分 析 裁 判 文书 中 的 判决 基于 字典 规则 的 方法 和 基于 机 器 学 习 的 方法 是 解决 短文 本 
结果 ， 判 断 其 是 否 支 持原 告 的 诉讼 请 求 。 裁 判 文书 中 判决 结果 ”情感 分 析 的 常用 手段 。 由 于 基于 字典 规则 的 方法 在 不 同类 型 或 
的 倾向 性 分 析 结 果 可 用 来 判断 裁判 文书 中 术语 使 用 是 否 合理 、 主题 的 语 料 上 难以 移植 和 泛 化 ， 同 时 过 度 依赖 于 专家 的 领域 知 
分 析 诉讼 律师 的 胜利 率 ， 这 对 于 裁判 文书 规范 化 、 诉 讼 律师 推 识 ， 近 年 来 逐渐 被 基于 机 器 学 习 的 方法 所 替代 或 融合 。 而 其 中 
荐 等 应 用 场景 有 着 重大 作用 。 然 而 ， 裁 判 文书 是 半 结 构 化 的 文 ”基于 深度 学 习 的 方法 不 需要 先 验 的 知识 ， 利 用 深度 神经 网 络 从 
本 ， 其 内 容 的 不 规范 、 人 工 记录 的 误差 、 术 语 使 用 的 不 一 致 等 ” 词 向 量 中 学 习 出 特征 ， 并 最 终生 成 语言 模型 。 
问题 ， 为 判决 结果 倾向 性 分 析 带 来 了 很 大 的 挑战 。 与 短文 本 情感 分 析 不 同 的 是 ， 判 决 结果 本 身 是 被 包含 在 裁 
判决 结果 的 倾向 性 分 析 类 似 短文 本 的 情感 分 析 问 题 。 首 先 ， ” 判 文书 这 样 半 结 构 的 文本 中 ， 无 法 直接 获得 ， 同 时 由 于 判决 结 
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录用 稿 


果 的 对 象 实体 对 倾向 性 结果 有 


使 ) 


j 的 是 人 名 等 称谓 ， 
识别 出 判决 的 多 重 实体 
从 裁判 文书 中 抽取 出 关键 特征 
决 结果 中 的 多 重 实体 ， 采 用 
法 ， 设 计 了 
判决 结果 作为 模型 的 训练 集 和 
的 规则 方法 、 
准确 率 ， 验 证 其 有 效 性 。 


决定 性 作 /) 
j 非 统一 的 法 律 实体 ， 因 此 需要 准 


]， 而 判决 结果 中 往往 
确 地 


进行 清洗 。 


本 文 为 了 解决 上 述 问 题 ， 


， 并 利 | 


模糊 匹配 的 方式 识别 判 


其 于 长 短 


期 记忆 模型 的 深度 学 习 方 


一 个 判决 结果 全 向 


本 文 的 贡献 主要 包括 ; 
验证 其 有 效 性 ，b) 在 判 
探究 神经 网 络 的 深度 对 分 类 结果 准确 度 的 影响 ;c) 利 用 模 灶 
解决 判决 结果 中 多 重 实体 的 识别 


向 性 分 析 中 ， 


中 
匹配 ， 


a 将 深度 学 习 应 用 到 判决 结果 的 倾 


性 分 析 模 型 。 仅 使 
测试 集 ， 通 过 实验 对 比 基 于 词典 
基于 深度 学 习 的 方法 在 判决 结果 倾向 性 分 析 中 的 


少量 标注 的 


决 结果 倾向 性 分 析 任 务 


问题 ;d) 针 对 裁判 文书 的 


语言 特点 ， 设 计 了 一 个 包括 文本 预 处 


中 间 步 又 无 须 人 工 参与 。 


1 


近年 来 , 情感 分 析 , 又 称 极 性 分 析 ， 
FP 最 热门 的 研究 问题 之 一 。 
规则 方法 ， 逐 步 转变 成 基于 机 器 学 习 的 方法 。 


领域 


息 的 


情感 分 析 的 相关 研究 


上 EE 


测试 文本 中 的 情感 词 在 词典 中 


— >、 


况 。 


竺 测 文本 中 的 词汇 与 种 子 词典 
本 的 情感 极 性 ; 
分 析 的 词典 。 


题 的 情感 词典 ， 


四 并 


Mohammad 


类 的 问题 ， 
时 , 需要 事先 标注 好 数据 。 文 献 
包括 支持 向 量 机 、 朴 素 贝 叶 基 
高 准确 率 。 文 献 [8,9] 尝 试 将 基于 字 
也 取得 不 错 的 进展 。 近 生 


完成 后 的 最 终 模 型 只 需要 输入 裁判 文 


基于 词典 的 规则 方法 ， 通 常 需要 先 构 建 情感 词典 ， 再 根据 
的 先 验 情 感 进行 整 条 文本 的 情感 
计算 。 这 种 方法 的 问题 包括 : 词典 无 法 覆盖 所 有 的 情感 词汇 ， 
地 别 是 快速 更 新 的 网 络 词汇 ;b) 情 感 词汇 本 身 在 不 同 的 语 境 下 
可 能 有 多 重 含义 。 针 对 第 一 个 问题 ， 


里 在 内 的 实验 模型 ， 训 练 


研究 方法 也 从 


上 和， 即 可 得 到 结果 标签 ， 


已 经 逐渐 发 展 成 为 NLP 


开始 的 基于 词 


Tumey 等 人 外 提出 了 根据 


中 词汇 的 关联 度 ， 来 判断 整 条 文 


等 人 BI] 尝试 生成 适合 社交 媒 
针对 第 二 个 问题 ， 庙 koun 等 人 四 提出 生成 
从 而 减少 因 主 题 的 发 散 ， 带 来 的 语义 多 样 的 情 


基于 机 器 学 习 的 方法 在 2002 年 ， 就 由 


体 情感 
面向 主 


Pang 中 首次 应 用 到 


情感 分 析 领 域 。 机 器 学 习 方 法 通常 是 将 情感 分 析 转 换 成 模式 分 


建立 分 类 模型 ， 对 情感 极 改 


作出 预测 。 在 建立 模型 


[6.7] 利 ) 


核心 思想 的 各 种 深度 学 习 模 型 
LSTM 模型 00， 减 少 运 算 量 的 GRU 模型 
LSTMI3， 被 纷纷 应 ) 


上 下 文 信息 的 双向 


中 文 而 


取得 了 不 错 的 效果 。 
究 主 要 针对 微 博 进 行情 感 分 析 。Tang 
word embedding 来 表示 词 信息 , Vo 等 人 05 使 | 


示 和 深度 学 习 的 特征 抽取 方法 
人 09 提 出 将 LSTM 模型 与 主题 融合 


上 


传统 的 机 器 学 习 方 法 ， 


等 ， 通 过 组 合 不 同 的 分 类 器 来 提 


， 包 括 Hochreiter 等 人 提出 了 


册 的 规则 和 传统 机 器 学 习 相 
FE 来 ， 以 循环 神经 网 络 RNNU0 为 


和 极 性 转移 模型 组 合 ， 张 冲 08 设 计 了 attention based LSTM 模 


型 。 在 


本 文 设计 的 基于 


1 所 示 。 


判决 结果 倾向 性 分 析 任 务 中 尚未 
的 方法 ， 包 括 深度 学 习 ， 进 行 分 析 。 


2 ”基于 深度 学 习 的 判决 结果 倾向 性 分 析 模 型 
深度 学 习 的 判决 结果 倾向 性 分 析 模 型 如 图 


人 使 / 


网 络 训练 


模型 


图 1 


基于 深度 学 习 的 判决 结果 倾向 性 分 析 模 型 


2.1 


sp 
gk 尖 | 


| 文 


裁判 文书 预 处 理 


基于 机 器 学 习 


书 是 半 结 构 化 文本 ,通常 的 结构 如 图 


【标题 】 
原告 : A 有 限 责任 公司 。 住 所 地 : # 省 # 冰 市 kk 水 。 
【其 他 内 容 1】 
被 告 : B 有 限 责任 公司 。 住 所 地 : ** 市 ***。 
【其 他 内 容 2】 判 决 如 下 : 
一 .B 有 限 责 任 公 司 于 本 判决 生效 之 日 起 十 日 内 向 A 有 
限 责任 公司 偿还 借款 本 金 10 亿 元 及 相应 利息 〈 自 2013 年 
12 月 18 日 起 至 本 判决 确定 的 给 付 之 日 止 以 上 述 本 金 为 基 
数 ， 按 年 利率 24% 计 付 ，B 公司 已 付 利息 139638888. 89 元 
从 中 扣 减 ); 
二 、 了 驱 回 A 公司 的 其 他 诉讼 请 求 。 
【其 他 内 容 3】 


裁 


图 2 裁判 文书 示例 


判 文书 中 包含 了 很 多 与 倾向 性 分 析 无 关 的 内 容 ， 


中 【其 他 内 容 1 【 


了 4， 可 以 挖 据 出 更 多 
到 情感 分 析 任 务 中 ， 


目前 这 些 研究 大 多 集中 在 英文 文本 ， 而 


等 人 0 提出 使 用 
j 基 于 分 布 式 词 表 


并 取得 很 好 的 分 类 效果 。 滕 飞 等 


, 梁 军 等 人 (7 提出 将 LSTM 


信息 ,【 其 


果 中 频繁 地 使 / 


其 他 内 容 2】 包 含 了 裁判 过 程 、 裁 
他 内 容 3】 包 含 了 裁判 依据 等 信息 。 
人 名 、 公 司 名 等 称谓 ， 而 非 “ 


原告 ”、 


2 所 示 。 


如 图 2 


判 理 | 
同时 由 于 裁判 结 


和 付 
本 


[9 被 告 2 


这 样 的 法 律 词汇 ， 在 后 续 的 分 词 阶段 中 ， 过 长 的 公司 名 、 机 关 
名 会 被 拆 分 成 多 个 词语 ， 导 致 信息 的 丢失 ， 并 最 终 影响 深度 训 
因此 ， 在 分 词 前 ， 从 裁判 文书 中 抽取 出 原告 、 被 告 
的 名 称 ， 并 将 判决 结果 中 的 名 称 蔡 换 成 法 律 用 词 。 


练 的 效果 。 


裁 


a) 数 据 抽 取 。 从 裁判 


判 文书 的 预 处 理 主要 分 为 以 下 几 个 步 又: 
文书 中 抽取 出 原告 、 被 告 、 判 决 结果 等 
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关键 特征 。 


于 裁判 文书 半 结 构 化 的 特点 ， 抽 取出 关键 特征 所 
在 的 段落 比较 容易 ， 从 段落 中 抽取 出 准确 的 特征 则 需要 根据 特 


征 上 下 文 设 计 不 同 的 正则 匹配 条 件 。 


bp) 数据 清洗 。 利 用 模 糙 


匹配 的 方式 ， 识 别 判决 结果 中 的 人 


名 、 公 司 名 等 称谓 ， 并 使 / 


j 语 代替 。 


SS 


相对 应 的 “原告 “被 告 ”等 法 律 


在 这 个 步骤 中 ， 有 一 些 判 决 结果 中 的 公司 名 与 原告 、 被 告 


中 的 名 称 不 完全 一 致 ， 比 如 抽取 出 的 原告 名 称 为 “北京 *# 工 程 


技术 


限 公 司 ” 而 在 判决 结果 中 使 用 


“** 工 程 技术 有 限 公 司 ” 


的 称谓 ， 这 些 称谓 通常 是 全 称 的 子囊， 因此 在 最 终 实验 的 数据 


清洗 过 程 中 使 / 


裁判 文书 的 内 容 ， 本 文 
向 量化 。 步 又 如 下 : 


2.3 


又 因为 输出 结果 是 一 个 向 量 ， 
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成 


a) 对 裁判 文书 进行 分 词 ; 
b) 训 练 得 到 词 向 量 ; 
9 将 上 一 阶段 的 分 词 结果 使 月 


J 份 词 回 量 ， 用 3 


深度 神经 网 络 


日 词 向 量 表示 ; 


3 是 本 文 设计 的 深度 神经 网 络 模 型 ， 将 词 向 量 表示 的 分 
词 结果 作为 LSTM 网 络 的 输入 。 由 于 倾向 性 分 析 的 最 终 输出 是 
分 类 标签 ， 因 此 只 需要 考虑 LSTM 最 后 一 个 单元 的 输出 结果 。 


所 以 额外 增加 了 一 层 隐藏 层 对 向 


的 是 最 长 公共 子 串 算法 进行 模糊 匹配 。W 是 所 


有 原告 与 被 告 名 称 的 集合 ，sx 是 第 k 个 名 称 wx 与 判决 结果 的 最 


长 公共 子 字符 串 ， 是 第 k 个 最 长 公 


子 串 sx 与 第 k 个 名 称 wx 


的 长 度 比 。 
W = {wi Wa, , Wn} 
length(sx.) 
rk 三 一 一 一 一 一 一 
length (wx) 


选择 集合 {rc} 中 的 最 大 值 所 对 应 的 身份 ，“ 
告 "， 替换 判决 结果 中 的 最 长 公共 子 串 。 
9 数据 标注 。 将 上 一 步骤 得 到 的 判决 结果 进行 人 


原告 ”或 则 “被 


标注 ， 


分 别 为 “支持 原告 “和 “不 支持 原告 ">。 针 对 一 些 特殊 情况 ， 本 文 


制定 了 额外 的 规则 ， 如 表 1 所 示 。 


量 进行 特 


整个 深度 神经 网 络 的 训练 完成 后 ， 


xx 


一 < 
DE 


| 设计 了 单 层 LSTM、 思 


FE 的 LSTM 


络 的 深度 对 于 判决 结果 倾向 性 分 析 结 果 的 影响 ， 图 
层 表 示 在 不 同 实验 中 


E 选 择 , 最终 输出 的 标签 使 用 


sigmoid 激活 函数 获得 。 
得 到 最 终 的 模型 。 本 文 分 


会 


层 LSTM、 三 层 LSTM 来 分 析 神 经 网 


3 中 虚线 标 
LSTM 层 数 会 进行 增 减 。 


本 文 使 


表 1 特殊 情况 标注 规则 
规则 标注 
单条 判决 结果 中 ， 部 分 支持 原告 ， 则 判定 支持 原告 。 
【例句 】 被 告 于 本 判决 生效 之 日 起 十 日 内 退还 原告 工程 
保证 金 1376505 元 ， 驳 回 原告 其 余 诉讼 。 
撤诉 判定 为 支持 原告 。 
【例句 1】 准 许 原告 撤诉 。 和 
【例句 2】 本 案 按 原告 撤回 起 诉 处 理 。 oe 
鹏 回 被告 的 反诉 请 求 判 定 为 持原 告 ， 同 理 ， 台 加 原告 。 、 
的 反诉 请 求 为 支持 被 告 。 人 
【例句 】 被 告 对 原告 提出 的 反诉 不 予 受理 。 


标注 时 


dd) 分 词 。 将 完成 上 述 步 又 的 关 


阶段 的 输入 。 
2.2 文本 向 量化 


3 人 进行 人 工 标注 ， 每 条 判决 结果 的 标注 由 3 
人 标注 的 结果 综合 判定 ， 从 而 降 


氏 人 工 出 错 的 可 能 性 。 


1 决 结果 进行 分 词 ， 作 为 下 一 


文本 向 量化 是 将 分 词 结果 使 


数值 向 量 表示 。 文 本 向 量化 


一 般 有 两 种 方式 : One-hot representation 和 Distributed 
representation。 本 文采 用 了 Distributed representation， 因 为 这 种 


使 | 


表示 方 涪 
不 同 维 


] 低 旨 


鸽 度 向 量 表示 每 个 词 ， 并 且 由 


于 将 词义 分 散 到 


度 上 ， 使 得 可 以 根据 向 量 
目前 己 经 有 一 些 开 源 的 词 向 量 了 ，(1 
景 与 本 文 需 要 的 裁判 文书 场景 相去 


判断 词语 之 间 的 相似 度 。 


日 十 


于 训练 的 语 料 场 


HH ,一 
圭 于 以 喧 ] 


同时 ， 为 了 充分 利用 


是 因为 对 于 RNN 而 言 ，Bengio 等 人 


失 的 问题 ,导致 后 面 时 


间 节 点 对 前 


图 3 深度 神经 网 络 模型 


了 Hochreiter 等 人 提出 了 LSTM 模型 作为 核心 ， 


9 发现 RNN 会 出 现 梯 度 
看 时 间 节 点 的 感知 力 下 降 。 


LSTM 在 RNN 的 基础 上 新 增 了 细胞 状态 和 门 两 个 概念 。 


胞 状态 会 在 整个 LSTM 隐藏 层 中 传输 ,存储 在 其 中 的 信息 不 


其 中 的 信息 进行 增删 。 门 结构 


丢失 ， 但 可 以 通过 不 同 的 门 对 


门 、 输 入 门 、 输 出 门 。 如 图 


时 


去 


恩 的 


I 结构，LSTM 中 包含 了 3 种 门 ， 分 别 是 遗忘 


4 所 示 。 


.| 
四 


图 4 
1 的 输入 ， 输 出 ， 


展示 了 LSTM 节点 的 内 部 结构 。xt，ht，Ct.，Ct 是 第 t 
胞 状态 和 细 


图 4 LSTM 节点 内 部 结构 


胞 状态 ， fi, lt， ot 是 第 t 


时 刻 的 遗忘 门 、 输 入 门 、 输 出 门 的 结果 。 它们 的 计算 公式 如 下 : 
遗忘 门 : fi = (Orxt + Uphe_i + by) 
输入 门 : it = o(Wixt + Uihe_1 + bi) 


输出 门 : or = o(Wxr + Uohe 
状态 候选 值 : Ce = tanh (Wx 


-1 十 Do) 
t+ Uche-1 + be) 
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录用 稿 王 业 沛 ， 等 : sy 
细胞 状态 更 新 : Ct = fh* Ce_i 十 i* CC 才能 判断 倾向 性 ， 因 此 与 情感 分 析 中 只 考虑 情感 词汇 不 同 ， 本 

六 = or * tanh(C,) 文 的 对 比 实验 中 使 用 了 由 词语 搭配 构成 的 词典 。 
其 中 : Wt，Wi，We。，Wo，Uf，Ui，U。，U。 是 权重 矩阵 ，bf，bi， 通过 不 断 调整 参数 训练 深度 学 习 模 型 ， 直 至 在 测试 集 上 取 
be， bo 是 偏 移 向 量 ，o 是 sigmoid 函数 。 得 较 好 的 实验 结果 ， 对 比 基 于 词典 方法 的 实验 结果 ， 统 计 如 表 
遗忘 门 用 来 控制 从 细胞 状态 中 丢弃 的 内 容 ， 诸 如 判决 结果 ”3, LSTM1,LSTM2,LSTM3 分 别 表示 单 层 、 两 层 、 三 层 LSTM 结 


中 赔偿 金额 、 赔 偿 时 间 ， 这 些 信息 对 标签 的 最 终 判 定 是 没有 影 构 ， P、N 表示 “支持 原告 “不 支持 原告 ”这 两 种 分 类 标签 。 可 
响 的 ， 因 此 在 训练 的 过 程 中 ， 类 似 信息 会 被 遗忘 。 输 入 门 用 来 ”以 发 现 ， 基 于 深度 学 习 的 方法 的 精确 度 总 是 优 于 基于 词典 的 方 
决定 哪些 新 信息 需要 增加 到 细胞 状态 中 , 例如 “ 驱 回 【空格 被。 法 ,标签 为 P 的 精确 度 优 于 标签 为 N 的 精确 度 ，LSTM 层 数 的 


告 【空格 】 反 诉 【 空 格 】 请 求 " 训练 时 ,“ 被 告 "一 词 是 “驳回 ” ”增加 会 提升 精确 度 。 

的 对 象 ， 对 最 终 的 标签 是 有 决定 性 影响 的 ， 因 此 会 被 更 新 到 表 3 深度 学 习 方法 和 词典 方法 的 实验 结果 
胞 状态 中 。 输 出 门 根据 当前 时 刻 的 输入 和 细胞 状态 控制 当前 时 Pp N ”合计 

刻 的 输出 内 容 。 基于 词典 0.93 0.904 0.924 

3 实验 与 结果 分 析 LSTM1 0.984 0.941 0.976 


LSTM2 0.984 0.950 0.978 


3.1 ， 语 料 数据 及 评价 标准 

在 判决 结果 倾向 性 分 析 的 任务 中 ， 目 前 尚未 有 标准 的 测试 
语料库 ， 因 此 本 文 所 使 用 的 语 料 数 据 是 从 中 国 裁判 文书 网 图 5 展示 了 神经 网 络 层 数 与 单个 选 代 训 练 时 间 的 关系 。 单 
(http://wenshu.court.gov.cn/) 上 下 载 的 裁判 文书 。 由 于 民事 案 个 训练 时 间 随 着 LSTM 层 数 的 增加 呈 线 性 递增 。 

件 的 判决 结果 通常 不 是 "一边倒 "的 情况 ， 即 判决 结果 中 有 支持 

原告 诉讼 请 求 的 内 容 ， 也 会 有 不 支持 原告 的 内 容 ， 因 此 本 文选 Wb 

择 了 民事 案件 中 占 比 最 多 的 三 种 案由 : 合同 纠纷 、 侵 权 责 任 纠 

纷 、 婚 姻 家 庭 纠 纷 ， 每 种 案由 下 载 了 500 份 裁判 文革。 裁判 文 

书 预 处 理 之 后 得 到 的 最 终 标注 数据 集 ， 统 计 如 表 2 所 示 。 


LSTM3 0.989 0.96 0.983 


表 2 标注 数据 集 统计 
支持 原告 ”不 支持 原告 ”合计 
990 218 图 5 神经 网 络 层 数 与 单位 迭代 训练 时 间 的 关系 图 


合同 纠纷 1208 
(81.95%) (18.05%) 


和 Ds 表 4 展示 了 在 不 同 数据 集 下 ， 单 层 LSTM 与 词典 方法 的 实 


侵权 责任 纠纷 947 分 结果 。 其 中 数据 集 C，TL， 示 合 同 纠纷 、 侵 权 责 任 
CO11790 (28.83%) 验 结果 。 其 中 数据 集 C，TL，WF 表示 合同 纠纷 、 侵 权 责 任 纠 


478 116 纷 、 婚 姻 家 庭 纠纷 这 三 类 判决 结果 集 ， 
婚姻 家 庭 纠纷 594 
(80.57%) (19.43%) 表 4 单 层 LSTM 和 词典 方法 在 不 同 数据 集 下 的 实验 结果 
2142 607 基于 深度 学 习 基于 词 
合计 2749 数据 集 
(77.92%) (22.08%) P N 合计 P N 合计 


© 0.982 0.978 0.981 0.9 0.936 0.907 


本 文 最 终 的 实验 语 料 是 带 标 签 2749 条 裁判 文书 的 判决 结 


TL 0.971 0.932 0.959 0.95 0.894 0.934 


本 
出 
o 


WF 0.987 0.889 0.968 0.941 0.862 0.926 


本 文采 用 了 准确 率 A(Accuracy ) 作 为 评测 指标 , 其 中 mriont， 
nwrong 分 别 是 预测 正确 和 错误 的 数量 。 


全 体 0.984 0.941 0.976 0.93 0.904 0.924 


_ Nrignt 由 实验 结果 可 以 发 现 : 

Nright + Nwrong a) 针 对 不 同 民事 案由 的 裁判 文书 ， 在 正 向 和 负 向 两 个 分 类 

3.2 ”实验 设计 及 结果 分 析 结果 中 ， 基 于 深度 学 习 的 方法 总 是 优 于 基于 词典 的 方法 ， 并 且 

本 次 实验 设计 了 四 组 实验 ， 分 别 是 基于 深度 学 习 的 方法 ， 全 局 准确 率 最 高 可 达到 98.3%。 证 明 本 文 设计 的 基于 深度 学 习 
包括 基于 单 层 LSTM， 两 层 LSTM， 三 层 LSTM， 和 基于 词 的 方法 在 判决 结果 倾向 性 分 析 任 务 中 有 很 好 的 可 扩展 性 。 

的 规则 方法 〈 对 比 实验 )。 D) 神 经 网 络 层 数 的 增加 可 以 提高 倾向 性 分 析 的 准确 度 ， 但 

在 判决 结果 中 ， 由 于 判决 的 对 象 无 法 固定 ， 如 “驳回 原告 ” ”是 单个 迭代 训练 的 时 间 随 网 络 层 数 线性 增长 。 虽 然 基 于 三 层 

或 者 “驳回 被 告 "， 这 两 种 表达 需要 根据 句 中 “驳回 ”的 具体 对 象 。” LSTM 的 训练 模型 比 基 于 单 层 LSTM 的 模型 在 准确 率 上 提高 了 
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国 
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录用 入 二 二 汪 直 全 让 是 全 的 


0.7%， 但 是 训练 时 间 却 增加 了 两 倍 。 因 此 ， 在 判决 结果 倾向 性 
分 析 任 务 中 ,基于 单 层 LSTM 的 深度 学 习 神经 网 络 的 综合 性 能 
最 好 。 

c) 标 签 为 “不 支持 原告 ”判决 结果 的 准确 率 普 遍 低 于 “支持 
原告 ”的 准确 率 ， 这 主要 是 因为 “不 支持 原告 ”的 这 类 语 料 过 少 ， 
深度 学 习 模 型 未 能 充分 学 习 预 料 中 各 种 表达 方式 ， 导 致 预测 时 
准确 率 较 低 。 

d) 婚 姻 家 庭 纠 纷 中 ,“ 不 支持 原告 "这 类 判决 结果 的 准确 率 
最 低 ， 主 要 原因 是 仅仅 根据 判决 结果 的 语义 ， 是 无 法 准确 预测 
此 类 数据 的 标签 。 如 判决 结果 为 “判决 被 告 承担 子女 抚养 权 ”， 
这 类 判决 结果 需要 根据 原告 的 具体 诉讼 请 求 是 希望 被 告 承担 抚 
养 权 ， 还 是 原告 自身 承担 抚养 权 ， 才 能 判定 这 种 判决 结果 的 分 
类 是 “支持 原告 * 还 是 “不 支持 原告 ”。 


4 ”结束 语 


本 文 首次 将 深度 学 习 引 入 对 判决 结果 的 倾向 性 分 析 任 务 中 ， 
尝试 从 非 结构 化 的 文本 中 提取 关键 特征 ， 利 用 模糊 匹配 方法 解 
决 判决 结果 中 的 多 实体 识别 的 问题 , 再 通过 基于 多 层 LSTM 的 
深度 神经 网 络 进行 倾向 性 判断 ， 将 整个 过 程 构建 成 一 个 针对 判 
决 结果 的 倾向 性 分 析 模 型 。 将 该 模型 在 三 种 不 同 案由 的 裁判 文 
书 数据 集 上 进行 实验 ， 都 达到 很 高 的 准确 率 ， 并 且 优 于 传统 的 
基于 词典 的 规则 方法 ， 验 证 了 该 模型 在 判决 结果 倾向 性 分 析 任 
务 中 具有 良好 的 可 扩展 性 和 应 用 价值 。 这 对 于 今后 的 裁判 文 
规范 化 、 推 荐 诉讼 律师 等 工作 具有 重要 的 意义 。 

本 文 提出 的 模型 目前 适用 的 范围 局 限 在 判决 结果 倾向 性 分 
析 任 务 中 ， 而 一 般 的 短文 本 情感 分 类 中 ， 单 条 文本 可 能 包含 多 
种 观点 或 情感 ,本 模型 是 否 适用 有 待 进一步 的 探究 。 另 一 方面 ， 
在 实验 过 程 中 也 发 现 了 该 模型 存在 的 一 些 问题 。 模 糊 匹 配 的 算 


由 


x 

| 
吕 
一 ~ 
Tl 


NaXiIv 
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法 需要 优化 ， 部 分 判决 结果 需要 更 多 的 特征 才能 判断 出 倾向 性 
(比如 婚姻 家 庭 纠 纷 中 子女 抚养 权 的 判决 ， 这 种 情况 需要 将 原 
告 的 诉讼 请 求 作为 分 析 倾 向 性 的 一 个 特征 )。 因此, 下 一 步 的 工 
作 就 是 设计 更 加 完善 的 模糊 匹配 的 算法 以 及 尝试 从 裁判 文书 中 
抽取 更 多 的 特征 作为 模型 的 输入 ， 从 而 提高 模型 的 准确 度 和 稳 
定性 。 
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